세상을 '보는' 기술, 비전 기반 항법(VBN)

세상을 ‘보는’ 기술, 비전 기반 항법(VBN)

1. 기계는 어떻게 스스로 길을 찾는가?

우리가 한 번도 가보지 않은 낯선 도시를 여행한다고 상상해 보자. 아마도 스마트폰의 지도 앱을 켜겠지만, 만약 배터리가 없거나 인터넷이 되지 않는다면 어떻게 길을 찾을까? 우리는 본능적으로 주변을 둘러보기 시작할 것이다. 눈에 띄는 높은 첨탑의 교회, 길모퉁이의 독특한 카페, 강을 가로지르는 다리 같은 ’랜드마크’를 기준으로 방향을 잡는다. 그리고 내가 얼마나 걸었는지, 어느 방향으로 몸을 돌렸는지 어림짐작하며 머릿속에 지도를 그려나간다. 이것이 바로 인간이 수천 년간 사용해 온 가장 원초적이고 직관적인 항법, 즉 시각에 의존하는 방식이다.1

현대 기술의 상징인 GPS(Global Positioning System)는 위성 신호를 이용해 지구상 어디에서든 우리의 위치를 알려주는 경이로운 시스템이다.2 하지만 GPS 역시 만능은 아니다. 위성 신호가 닿지 않는 실내 공간, 높은 빌딩이 숲처럼 솟아 있는 도심의 “어반 캐니언(Urban Canyon)”, 깊은 수중, 혹은 GPS 위성이 존재하지 않는 화성 같은 외계 행성에서는 무용지물이 된다.3 자율주행차, 배송 드론, 탐사 로봇이 이러한 환경에서도 길을 잃지 않으려면 GPS를 대체하거나 보완할 새로운 ’눈’이 필요하다.

이러한 필요성에서 탄생한 기술이 바로 **비전 기반 항법(VBN: Vision-Based Navigation)**이다. VBN은 기계에 카메라라는 ’눈’을 달아주어, 인간처럼 주변 환경을 ‘보고’ 이해하며 자신의 위치를 파악하고 나아갈 길을 찾는 기술이다.3 이는 단순히 GPS의 보조 수단을 넘어, 기계가 진정한 의미의 자율성을 갖추기 위한 핵심 기술로 자리매김하고 있다.

본 안내서는 비전 기반 항법이라는 흥미로운 세계를 처음 접하는 독자들을 위해 마련되었다. ’본다’는 행위의 단순한 직관에서 출발하여, 이 기술을 현실로 만드는 복잡하고 정교한 알고리즘의 세계로 독자들을 안내할 것이다. 기계가 세상을 어떻게 인식하고, 움직임을 어떻게 계산하며, 스스로 지도를 그려나가는지 그 원리를 차근차근 탐구해 볼 것이다. 또한 VBN이 다른 항법 기술과 어떻게 다른지 비교하고, 인공지능과 만나 어떻게 진화하고 있는지 살펴본다. 마지막으로 자율주행차부터 화성 탐사 로버에 이르기까지, VBN이 실제로 어떻게 세상을 바꾸고 있는지 생생한 사례를 통해 확인하고 그 미래를 조망해 볼 것이다. 이제, 인공지능의 눈을 통해 세상을 바라보는 여정을 시작해 보자.

2. 비전 기반 항법의 첫걸음 - ’본다’는 것의 의미

비전 기반 항법의 핵심은 ’보는 행위’를 통해 위치와 방향에 대한 정보를 얻는 것이다. 이 첫 번째 부에서는 VBN의 가장 기본적인 개념들을 소개한다. 복잡한 수학이나 코드를 잠시 접어두고, 우리가 일상에서 길을 찾는 방식에 빗대어 VBN의 직관적인 원리를 이해하는 데 집중할 것이다.

2.1 장: 인간처럼 길 찾기 - VBN의 직관적 이해

2.1.1 여행자의 비유

VBN의 개념을 가장 쉽게 이해하는 방법은 스마트폰과 GPS가 없던 시절, 우리가 어떻게 길을 찾았는지 떠올려보는 것이다. 시골의 작은 마을에 있는 맛집을 찾아가는 여정을 상상해 보자. 친구가 적어준 길 안내 메모는 아마 다음과 같을 것이다.1

  1. “여관을 나와 큰길에서 오른쪽으로 돌아.”
  2. “뾰족한 첨탑이 있는 교회가 보일 때까지 약 1마일 정도 직진해. 교회에서 왼쪽으로 꺾어.”
  3. “언덕을 올라가다 보면 호수가 보일 거야. 호수를 지나 두 번째 우체통에서 오른쪽으로 들어가면 돼.”

이 안내에서 ’1마일’이라는 대략적인 거리를 제외하면, 모든 지시는 시각적으로 확인할 수 있는 랜드마크에 기반한다. 운전자도, 자동차도 자신의 정확한 위도와 경도 좌표를 알지 못한다. 목적지나 중간 경유지의 절대적인 좌표 정보도 없다. 모든 움직임은 ‘첨탑이 있는 교회’, ‘호수’, ’두 번째 우체통’처럼 눈으로 식별하고 측정할 수 있는 대상과 그에 대한 행동으로 기술된다.1 이것이 바로 비전 기반 항법의 정수다.

2.1.2 비전 기반 항법(VBN)의 정의

이 비유를 바탕으로 VBN을 보다 공식적으로 정의할 수 있다. 비전 기반 항법이란, 로봇이나 차량과 같은 이동체에 장착된 카메라와 같은 광학 센서를 사용하여 주변 환경에 대한 시각 데이터를 수집하고, 이를 분석하여 환경 내에서 자신의 위치와 방향(자세, Pose)을 결정한 뒤, 목표 지점까지의 이동을 계획하고 실행하는 기술 체계를 의미한다.1 즉, 기계가 ‘보는’ 행위를 통해 “나는 지금 어디에 있고, 어느 쪽을 바라보고 있는가?“라는 질문에 스스로 답하게 만드는 기술이다.

2.1.3 VBN이 필요한 이유: GPS 음영 지역

VBN이 강력한 이유는 바로 현대 항법의 표준인 GPS가 제 역할을 하지 못하는 환경에서 대안을 제시하기 때문이다. 이러한 ’GPS 음영 지역(GPS-Denied Environments)’은 우리 주변에 생각보다 많다.3

  • 실내 공간: 위성 신호는 건물의 벽이나 지붕을 통과하지 못한다. 따라서 거대한 물류 창고, 스마트 팩토리, 쇼핑몰, 공항 터미널 등에서 자율적으로 움직이는 로봇이나 카트는 GPS를 사용할 수 없다. VBN은 이러한 실내 환경에서 로봇이 자신의 위치를 파악하고 효율적으로 작업을 수행하게 해주는 핵심 기술이다.3
  • 어반 캐니언: 뉴욕이나 서울 도심처럼 고층 빌딩이 밀집한 지역에서는 위성 신호가 건물에 의해 가려지거나 반사되어 심각한 오차를 유발한다. 자율주행차가 차선을 정확히 유지하고 복잡한 교차로를 통과하기 위해서는 GPS의 부정확성을 보완할 VBN의 정밀한 위치 인식이 필수적이다.3
  • 적대적/원격 환경: 군사 작전 지역에서는 적의 전파 방해(Jamming)로 GPS 신호가 교란될 수 있다. 또한, 위성 신호가 닿기 어려운 깊은 숲이나 협곡, 동굴 등에서도 VBN은 드론이나 로봇이 임무를 지속할 수 있게 해준다.3
  • 지구 밖 우주: 인류의 활동 무대가 지구를 넘어 달이나 화성으로 확장되면서 VBN의 중요성은 더욱 커지고 있다. GPS 인프라가 전무한 외계 행성에서 탐사 로버가 지형을 분석하고 장애물을 피해 과학적 목표 지점까지 자율적으로 이동하는 것은 전적으로 VBN에 달려 있다.6

이처럼 VBN은 단순히 GPS의 대체재가 아니라, GPS의 한계를 극복하고 자율 시스템의 활동 영역을 전례 없는 수준으로 확장하는 근본적인 기술이라 할 수 있다.

2.2 장: 움직임을 계산하다 - 비주얼 오도메트리(Visual Odometry)

VBN의 가장 기본적인 질문은 “나는 얼마나 움직였는가?“이다. 이 질문에 답하는 기술이 바로 ’비주얼 오도메트리(Visual Odometry, VO)’다. VO의 개념을 이해하기 위해 먼저 ’오도메트리’라는 용어부터 살펴보자.

2.2.1 오도메트리의 핵심 아이디어

오도메트리(Odometry)는 ’경로(Odos)’와 ’측정(Metron)’을 의미하는 그리스어에서 유래했으며, 말 그대로 이동체의 움직임을 측정하여 위치 변화를 추정하는 기술을 총칭한다.9 가장 직관적인 예는 자동차의 주행기록계(Odometer)다. 주행기록계는 바퀴의 회전수를 세어 자동차가 얼마나 멀리 이동했는지 계산한다.9 이처럼 오도메트리는 시작점으로부터의 상대적인 이동을 계산하는 데 중점을 둔다.

2.2.2 비주얼 오도메트리(VO)의 등장

비주얼 오도메트리는 이 오도메트리의 원리를 ’바퀴’가 아닌 ’카메라’에 적용한 것이다. 즉, 이동체에 장착된 카메라가 연속적으로 촬영한 이미지들 사이의 시각적 변화를 분석하여 이동체의 움직임(Egomotion)을 추정하는 기술이다.11 VO는 “방금 전 찍은 사진과 지금 찍은 사진을 비교하니, 내가 이만큼 움직였구나“라고 계산하는 과정과 같다.

2.2.3 VO 파이프라인 단계별 분석

VO 시스템은 일반적으로 다음과 같은 단계적인 처리 과정(파이프라인)을 거쳐 움직임을 계산한다.

  1. 이미지 획득 (Image Acquisition): 가장 먼저, 카메라는 일정한 시간 간격으로 주변 환경의 이미지를 연속적으로 촬영한다. 이때, 연속된 이미지 프레임 간에 충분한 영역이 겹쳐야만 시각적 변화를 추적할 수 있다.11 너무 빨리 움직여서 두 이미지가 완전히 다른 장면을 담고 있다면 비교 자체가 불가능하기 때문이다.
  2. 특징점 검출 (Feature Detection): 시스템은 획득한 이미지에서 ‘흥미로운’ 또는 ‘독특한’ 지점들을 찾아낸다. 이를 ’특징점(Feature Point)’이라고 부른다. 특징점은 주변과 구별되는 고유한 패턴을 가진 지점으로, 주로 건물의 모서리, 창문틀, 독특한 질감의 표면 등이 해당된다. 컴퓨터는 이러한 특징점을 SIFT(Scale-Invariant Feature Transform), SURF(Speeded Up Robust Features), ORB(Oriented FAST and Rotated BRIEF)와 같은 알고리즘을 사용해 픽셀 단위에서 찾아낸다.12 이는 마치 우리가 낯선 방을 둘러볼 때, 평범한 흰 벽보다는 벽에 걸린 그림이나 책상의 모서리에 먼저 시선이 가는 것과 유사하다.
  3. 특징점 매칭/추적 (Feature Matching/Tracking): 다음으로, 시스템은 이전 이미지 프레임에서 찾은 특징점들을 현재 프레임에서 다시 찾아 연결하는 ‘매칭’ 또는 ‘추적’ 작업을 수행한다.12 예를 들어, KLT(Kanade-Lucas-Tomasi) 추적기와 같은 알고리즘은 이전 프레임의 특징점 주변 픽셀 정보를 바탕으로 현재 프레임에서 해당 특징점이 어디로 이동했는지 추적한다.13 또는 각 특징점의 외형을 요약한 수학적 기술자(Descriptor)를 비교하여 가장 유사한 쌍을 찾아 연결하기도 한다.15
  4. 움직임 추정 (Motion Estimation): 마지막으로, 매칭된 특징점들이 두 이미지 사이에서 어떻게 이동했는지를 분석하여 카메라의 3차원 움직임, 즉 회전(Rotation)과 평행 이동(Translation)을 계산한다.10 이 과정은 ’에피폴라 기하학(Epipolar Geometry)’이라는 원리를 기반으로 하며, ’기본 행렬(Fundamental Matrix)’이나 ’필수 행렬(Essential Matrix)’이라는 수학적 모델을 풀어내는 방식으로 이루어진다.10 간단히 말해, 여러 특징점들의 2차원적인 이동 패턴을 종합하여 카메라의 3차원 공간상 움직임을 역산하는 것이다.

2.2.4 VO의 아킬레스건: 드리프트(Drift)

VO는 매우 강력한 기술이지만, 치명적인 약점을 가지고 있다. 바로 ‘드리프트(Drift)’ 또는 ’누적 오차’라고 불리는 현상이다.9 VO는 각 단계의 움직임을 바로 이전 단계의 위치를 기준으로 계산한다. 이 과정에서 아주 작은 측정 오차라도 발생하면, 그 오차는 다음 계산에 그대로 반영된다. 이러한 작은 오차들이 시간이 지남에 따라 눈덩이처럼 불어나면서 실제 위치와의 차이가 점점 커지게 된다.17

이는 눈을 가리고 열 걸음을 걸은 뒤, 다시 눈을 가리고 열 걸음을 걷는 과정을 반복하는 것과 같다. 매번 조금씩 방향이 틀어지면, 수백 걸음 뒤에는 출발점에서 의도했던 것과는 전혀 다른 곳에 도착하게 될 것이다. 이처럼 드리프트 현상 때문에 VO만으로는 장시간 동안 정확한 위치를 유지하기 어렵다. 이 한계를 극복하기 위해 등장한 개념이 바로 다음 장에서 다룰 SLAM이다.

2.3 장: 지도와 나를 동시에 그리다 - SLAM(슬램)

VO가 “나는 방금 얼마나 움직였나?“라는 단기적인 질문에 답한다면, SLAM은 “나는 지금 어디에 있고, 내 주변은 어떻게 생겼나?“라는 보다 근본적인 질문에 답하려는 시도다.

2.3.1 “닭이 먼저냐, 달걀이 먼저냐” 문제

SLAM은 **동시적 위치추정 및 지도작성(Simultaneous Localization and Mapping)**의 약자다. 이 이름에는 자율 항법의 가장 핵심적인 딜레마가 담겨 있다. 바로 “닭이 먼저냐, 달걀이 먼저냐“와 같은 문제다.17

  • 정확한 지도가 있으려면, 지도를 그리는 동안 내가 어디에 있었는지 정확히 알아야 한다.
  • 내 위치를 정확히 알려면, 주변 지형지물과 나를 비교할 수 있는 정확한 지도가 있어야 한다.

이처럼 위치추정(Localization)과 지도작성(Mapping)은 서로가 서로를 필요로 하는, 뗄 수 없는 관계에 있다. SLAM은 이 두 가지 문제를 ‘동시에’ 풀어내는 기술적 프레임워크다.

2.3.2 vSLAM: 시각으로 푸는 SLAM

SLAM은 레이저 센서(LiDAR), 초음파 센서 등 다양한 센서를 사용할 수 있지만, 카메라를 주된 센서로 사용할 때 이를 특별히 **vSLAM(Visual SLAM)**이라고 부른다.19 vSLAM은 고대 항해사가 별을 관측하여 별자리 지도(성도)를 만들면서, 동시에 그 성도를 이용해 망망대해에서 자신의 배 위치를 파악했던 것과 원리가 같다.19 카메라는 별을 관측하는 망원경이고, 주변 환경의 특징점들은 밤하늘의 별과 같은 역할을 한다.

2.3.3 직소 퍼즐 비유로 이해하는 vSLAM

vSLAM의 복잡한 과정을 이해하는 데 ’직소 퍼즐 맞추기’만큼 좋은 비유는 없다. 이 비유를 통해 vSLAM의 핵심 요소들을 직관적으로 파악해 보자.21

  • 초기화 (첫 번째 퍼즐 조각): vSLAM 시스템을 처음 켜면, 카메라는 첫 번째 이미지 프레임을 얻는다. 이것은 상자에서 막 꺼낸 첫 번째 퍼즐 조각과 같다. 아직 전체 그림이 어떻게 생겼는지, 이 조각이 어느 부분에 해당하는지 전혀 알 수 없다.21 이 첫 프레임이 지도의 기준점이 된다.

  • 특징점 추출 및 지도 작성 (퍼즐 조각 찾고 놓기): 시스템은 계속해서 새로운 카메라 프레임을 받아들이고, VO에서처럼 이미지의 독특한 특징점(모서리, 질감 등)을 찾아낸다. 이 특징점들이 바로 퍼즐의 각 조각에 그려진 고유한 그림이나 모양이다. 시스템은 이 특징점들의 3차원 위치를 추정하여 ’지도(Map)’에 추가한다. 이는 새로운 퍼즐 조각을 찾아내 이미 맞춰진 조각들 옆에 하나씩 붙여나가는 과정과 같다.20

  • 위치 추정 (퍼즐 속 내 위치 파악하기): 이동체가 움직이면서 카메라는 이전에 지도에 등록했던 익숙한 특징점들을 다시 보게 된다. 시스템은 이 ’알려진 랜드마크’들을 인식함으로써, 자신이 지금 만들고 있는 지도 위의 어디쯤에 있는지를 역으로 추정할 수 있다. 이는 퍼즐을 맞추다가 잠시 고개를 들어 내가 지금 퍼즐의 어느 부분을 작업하고 있는지 전체 판을 훑어보는 것과 같다.22

  • 루프 클로징 (전체 그림 바로잡기): 이것이 바로 vSLAM의 백미이자, VO의 드리프트 문제를 해결하는 핵심적인 단계다. 로봇이 한 바퀴 돌아 출발점 근처로 되돌아왔다고 가정해 보자. 시스템은 “어, 이 풍경은 내가 아까 봤던 곳인데!“라고 인식하게 된다. 이것을 루프 폐쇄(Loop Closing) 또는 **루프 탐지(Loop Detection)**라고 한다.17

이 순간, 시스템은 두 가지 시점의 위치 정보, 즉 드리프트가 누적된 현재의 추정 위치와 과거에 기록했던 원래 위치 정보를 모두 갖게 된다. 이 둘 사이의 오차를 계산하여, 그동안 쌓여왔던 모든 경로의 오차를 전체적으로 보정하고 지도를 재정렬한다. 이는 직소 퍼즐의 두 개의 큰 덩어리를 독립적으로 맞추다가, 마침내 두 덩어리를 연결하는 조각을 찾았을 때와 같다. 두 덩어리가 딱 맞아떨어지는 순간, 그동안 약간씩 어긋나 있던 모든 조각들의 위치가 한 번에 제자리를 찾게 되는 것이다.21 이 루프 클로징 덕분에 vSLAM은 장기적으로 일관성 있는 지도를 만들고 정확한 위치를 유지할 수 있다.

2.3.4 VBN의 작동 방식에 대한 깊은 이해

여기서 우리는 VBN의 작동 방식에 대한 두 가지 중요한 통찰을 얻을 수 있다.

첫째, VBN이 세상을 ’이해’하는 방식은 인간과 근본적으로 다르다. 인간은 ‘의자’, ’책상’과 같은 의미론적(semantic) 개념으로 세상을 인식하지만, 전통적인 VBN 시스템은 세상을 순수한 기하학적 정보의 집합으로 추상화한다. 시스템이 보는 것은 ’의자’가 아니라, 특정 픽셀 패턴을 가진 ’모서리들의 집합’과 ’평면’이다.12 VO는 픽셀 좌표의 변화를 추적하고 10, SLAM은 기하학적 특징점들의 3차원 지도를 구축한다.21 이러한 추상화는 계산 효율성이라는 큰 장점을 갖지만, 의미론적 이해가 부족하다는 명백한 한계도 가진다. 예를 들어, 실제 복도와 매우 사실적인 복도 사진을 구분하지 못할 수도 있다. 이 한계는 2부에서 다룰 딥러닝 기반 VBN의 등장을 촉발하는 중요한 배경이 된다.

둘째, VO와 SLAM은 별개의 기술이 아니라, 종종 하나의 완성된 시스템 안에서 상호 보완적으로 작동하는 공생 관계에 있다. 많은 vSLAM 시스템은 두 부분으로 구성된다. 빠른 속도로 프레임 간의 움직임을 계산하는 ’프론트엔드(Front-end)’와, 이렇게 계산된 움직임을 바탕으로 전체 지도를 최적화하고 루프 클로징을 수행하여 드리프트를 보정하는 ’백엔드(Back-end)’다.17 여기서 VO가 프론트엔드의 역할을 수행한다. 즉, VO는 빠르고 민첩한 ’지역 항법사’로서 단기적인 움직임을 담당하고, SLAM은 느리지만 정확한 ’전역 지도 제작자’로서 장기적인 일관성을 책임지는 구조다. 초심자는 이 둘을 경쟁 관계로 볼 것이 아니라, 강력한 항법 시스템을 구축하기 위해 협력하는 파트너로 이해해야 한다.

3. VBN 시스템 심층 분석 - 어떻게 더 정확하고 강인해지는가?

1부에서 VBN의 기본 원리를 이해했다면, 2부에서는 이 기술이 실제 세계의 불확실성과 복잡성을 어떻게 극복하고 더 정확하고 강인한 시스템으로 발전하는지 심층적으로 분석한다. 어떤 상황에서 어떤 기술을 선택해야 하는지, 그리고 여러 기술을 어떻게 융합하여 시너지를 내는지에 대한 공학적 지혜를 살펴볼 것이다.

3.1 장: VBN 기술 포트폴리오 비교 분석

세상에 완벽한 항법 기술은 없다. 모든 기술은 저마다의 장단점을 가지며, 특정 응용 분야의 요구사항(비용, 환경, 정확도, 실시간성 등)에 따라 최적의 선택이 달라진다. VBN을 올바르게 이해하기 위해서는 다른 주요 항법 기술과의 비교를 통해 그 기술적 위상과 고유한 가치를 파악하는 것이 중요하다.

3.1.1 항법 기술 비교 분석표

아래 표는 VBN을 포함한 주요 항법 기술들의 특징을 한눈에 비교하여 보여준다. 이 표는 각 기술의 작동 방식을 이해하고, 어떤 상황에서 어떤 기술이 유리한지에 대한 직관을 제공하는 데 목적이 있다.

기술 분류작동 원리핵심 장점핵심 단점일반적 비용최적 환경
GPS/GNSS다수의 위성으로부터 신호를 수신, 신호 도달 시간 차이를 이용해 삼각측량 방식으로 3차원 위치 계산.2전 지구적 커버리지, 기술 성숙도 높음, 수신기 비용 저렴.24위성 신호가 수신되어야 함 (실내/지하/수중 불가), 전파 방해/차단에 취약, 도심 협곡에서 정확도 저하.2낮음실외, 하늘이 열린 공간
INS (관성항법장치)가속도계와 자이로스코프(IMU)를 이용해 이동체의 가속도와 각속도를 측정하고, 이를 적분하여 속도, 방향, 위치를 계산.26외부 신호 없이 독립적으로 작동 (자체 포함형), 높은 데이터 갱신율(수백 Hz), 전파 방해에 강함.26시간이 지남에 따라 오차가 누적(드리프트)되어 외부 정보(GPS 등)로 주기적인 보정이 필요.24낮음 ~ 매우 높음 (센서 등급에 따라)모든 환경 (특히 다른 센서의 보조 역할로 탁월)
LiDAR (라이다)레이저 펄스를 발사하고, 물체에 반사되어 돌아오는 시간을 측정하여 거리를 계산. 이를 통해 주변 환경의 정밀한 3차원 점 구름(Point Cloud) 지도를 생성.28매우 높은 정밀도와 정확도의 3차원 데이터 획득, 주야간/어둠 속에서도 작동 가능.28고가, 상대적으로 부피가 큼, 안개/비/눈과 같은 악천후에 성능 저하 가능성, 투명하거나 검은 물체 인식 어려움.5높음정밀한 3D 지도가 필요한 모든 환경
VBN (비전 기반 항법)카메라로 촬영한 연속적인 이미지들을 분석하여 특징점의 움직임을 추적하거나, 사전에 구축된 지도와 대조하여 위치와 자세를 추정.1저렴한 하드웨어(카메라), 풍부한 정보(색상, 질감 등) 획득 가능, 수동적 센서로 외부 노출 적음.25빛과 질감(텍스처)에 의존적 (어둡거나 특징 없는 환경에서 취약), 높은 계산량 요구, 날씨/조명 변화에 민감.25낮음질감이 풍부하고 조명이 적절한 환경, GPS 음영 지역

3.1.2 VBN의 고유한 가치

위 표를 통해 VBN의 독특한 포지션을 명확히 할 수 있다. VBN의 핵심 가치는 **‘저비용 고밀도 정보’**에 있다. LiDAR처럼 밀리미터 단위의 정밀도를 제공하지는 못하고, INS처럼 외부 환경과 무관하게 작동하지도 않으며, GPS처럼 전 지구적 위치를 알려주지도 않는다. 하지만 VBN은 가장 저렴하고 구하기 쉬운 센서인 ’카메라’를 사용하여, 다른 어떤 센서보다도 풍부하고 맥락적인 정보(색상, 모양, 질감)를 얻을 수 있다는 압도적인 장점을 가진다.25

이러한 특징 덕분에 VBN은 GPS 음영 지역에서 독립적인 항법 솔루션으로 기능할 뿐만 아니라, 다른 고가의 센서들과 융합될 때 시스템 전체의 강인성(robustness)과 경제성을 크게 향상시키는 중요한 구성 요소로 활약한다.

3.2 장: 약점을 보완하는 지혜 - 센서 퓨전(Sensor Fusion)

“센서가 많을수록 좋은 것 아닌가?“라는 질문에 대한 답은 “반드시 그렇지는 않다“이다.31 단순히 여러 센서의 데이터를 모으는 것을 넘어, 각 센서의 장점은 취하고 단점은 서로 보완하도록 ‘지능적으로’ 정보를 결합하는 것이 바로

센서 퓨전의 핵심이다.32 이는 마치 각기 다른 전문 분야를 가진 전문가들이 모여 하나의 복잡한 문제를 해결하는 것과 같다.

3.2.1 최강의 조합: VIO (Visual-Inertial Odometry)

센서 퓨전의 가장 대표적이고 강력한 조합은 단연 시각-관성 오도메트리(VIO), 즉 카메라(Vision)와 IMU(Inertial Measurement Unit)의 결합이다. 이 둘은 마치 환상의 파트너처럼 서로의 약점을 완벽하게 보완한다.

  • 카메라(Vision)의 장단점: 카메라는 주변 환경을 인식하여 위치를 보정하고 드리프트를 막는 데 탁월하다. 하지만 이미지 처리에는 시간이 걸려 데이터 갱신율이 낮고(보통 15-60 fps), 움직임이 너무 빠르면 모션 블러(motion blur)로 인해 특징점을 놓치기 쉽다. 또한, 특징점이 없는 하얀 벽이나 어두운 공간에서는 무력해진다.
  • IMU(Inertial)의 장단점: IMU는 수백 Hz의 매우 높은 갱신율로 가속도와 각속도를 측정하여 아주 짧은 순간의 움직임을 정밀하게 계산할 수 있다. 하지만 이 측정값을 계속 적분하여 위치를 계산하기 때문에 시간이 지남에 따라 오차가 기하급수적으로 누적되는 ‘드리프트’ 현상이 매우 심각하다.27

VIO의 시너지: VIO 시스템에서 IMU는 카메라 프레임과 프레임 사이의 짧은 시간 동안의 움직임을 높은 빈도로 제공한다. 이 정보는 카메라가 다음 프레임에서 특징점을 더 빠르고 안정적으로 추적할 수 있도록 돕는다. 반대로, 카메라는 가끔씩 주변의 특징점을 인식하여 “아, 저기 기둥이 보이네. 내 위치는 여기가 맞아“라고 알려줌으로써, IMU가 그동안 쌓아온 누적 오차(드리프트)를 한 번에 보정해준다.27 이처럼 VIO는 카메라의 장기적인 정확성과 IMU의 단기적인 정밀성을 결합하여, 두 센서 중 어느 하나만 사용하는 것보다 훨씬 더 강인하고 정확한 움직임 추정을 가능하게 한다.

3.2.2 다른 센서와의 융합

VIO 외에도 VBN은 다른 센서들과 융합하여 성능을 극대화할 수 있다.

  • VBN + LiDAR: LiDAR는 주변 환경까지의 거리를 매우 정밀하게 측정할 수 있다. 이 정확한 3차원 깊이 정보는 vSLAM이 더 정확한 지도를 구축하도록 돕는다. 특히, 카메라 하나만 사용하는 단안(monocular) VBN은 실제 크기(scale)를 알 수 없는 한계가 있는데, LiDAR의 거리 정보가 이 ‘스케일 모호성’ 문제를 해결해준다.5
  • VBN + GPS: 실외 환경에서는 GPS가 제공하는 절대적인 위치 정보가 VBN 시스템 전체의 드리프트를 주기적으로 보정하는 ‘기준점’ 역할을 할 수 있다.5 터널에 진입하여 GPS가 끊기면 VBN/VIO가 항법을 이어가고, 터널을 빠져나와 다시 GPS 신호를 받으면 그동안 쌓인 오차를 한 번에 수정하는 식이다.

3.2.3 센서 퓨전의 두뇌: 칼만 필터(Kalman Filter)

이러한 센서 퓨전의 배후에는 칼만 필터라는 강력한 수학적 도구가 있다. 칼만 필터는 불확실한 정보를 다루는 데 특화된 알고리즘이다. 간단히 설명하면, 칼만 필터는 두 단계를 반복한다.21

  1. 예측(Predict): 현재 상태(예: 위치, 속도)와 움직임 모델을 기반으로 다음 순간의 상태를 예측한다. 이 예측은 당연히 오차를 포함한다.
  2. 갱신(Update): 그 다음 순간, 실제 센서(GPS, 카메라 등)로부터 측정값을 받는다. 이 측정값 역시 노이즈가 섞여 있다. 칼만 필터는 예측값과 측정값 사이의 불일치를 분석하여, 두 정보를 가중 평균하는 방식으로 ‘가장 가능성이 높은’ 최적의 현재 상태를 추정해낸다.35

이 과정을 계속 반복하면서 칼만 필터는 여러 센서로부터 들어오는 불완전한 정보들을 융합하여 시스템의 상태를 가장 정확하게 추적해 나간다.

3.3 장: 딥러닝, VBN에 날개를 달다

지금까지 설명한 VBN은 대부분 인간이 설계한 규칙(예: 모서리를 찾아라, 특징점을 비교하라)에 따라 작동하는 ‘전통적인’ 또는 ‘기하학 기반’ 방식이었다. 그러나 최근 인공지능의 발전, 특히 **딥러닝(Deep Learning)**의 등장은 VBN의 패러다임을 근본적으로 바꾸고 있다.36

3.3.1 딥러닝이 해결하는 문제들

딥러닝은 VBN이 가진 고질적인 문제들을 해결하고 그 능력을 새로운 차원으로 끌어올린다.

  • 의미론적 이해(Semantic Understanding): 전통적인 VBN에게 세상은 점, 선, 면의 집합일 뿐이다. 하지만 딥러닝 모델은 이미지 속의 픽셀 덩어리가 ’자동차’인지, ’사람’인지, ’정지 신호’인지를 구분할 수 있다. 이를 객체 탐지(Object Detection) 또는 **의미론적 분할(Semantic Segmentation)**이라고 한다.38 이러한 의미론적 이해는 훨씬 더 지능적인 항법을 가능하게 한다. 예를 들어, ’사람’으로 인식된 객체 주변에서는 속도를 줄이고, ’도로’로 인식된 영역으로만 주행 경로를 계획할 수 있다.
  • 어려운 환경에서의 강인성: 전통적인 특징점 검출기는 조명이 갑자기 바뀌거나, 비나 눈이 오거나, 질감이 없는 평평한 벽 앞에서는 쉽게 실패한다. 딥러닝 모델은 수많은 다양한 환경의 데이터를 학습함으로써 이러한 어려운 조건에서도 더 강인하게 특징을 추출하고 환경을 인식할 수 있도록 훈련될 수 있다.40
  • 종단간 항법(End-to-End Navigation): 가장 혁신적인 접근법 중 하나는 ‘종단간(end-to-end)’ 학습이다. 이 방식은 특징점 검출, 움직임 추정, 경로 계획과 같은 중간 단계를 모두 생략하고, 카메라 이미지(입력)를 받아서 조향각이나 가속/감속 명령(출력)을 직접적으로 생성하도록 신경망 전체를 한 번에 학습시킨다.37 이는 마치 숙련된 운전자가 도로 상황을 ‘보고’ 거의 무의식적으로 운전하는 것과 유사하다.

3.3.2 딥러닝의 새로운 과제

물론 딥러닝이 만병통치약은 아니다. 새로운 가능성을 여는 만큼 새로운 과제도 제시한다.

  • 데이터 의존성: 딥러닝 모델의 성능은 학습 데이터의 양과 질에 절대적으로 의존한다. 다양한 시나리오를 포괄하는 방대하고 잘 정제된 데이터셋을 구축하는 것은 엄청난 비용과 노력이 드는 일이다.36
  • 높은 계산 비용: 거대한 신경망을 훈련하고 실행하는 데에는 막대한 계산 자원이 필요하다. 이는 배터리와 처리 성능이 제한된 소형 드론이나 모바일 기기에서는 큰 부담이 될 수 있다.42
  • 일반화와 ‘블랙박스’ 문제: 서울에서 훈련된 자율주행 모델이 낯선 뉴욕의 도로에서도 잘 작동할 것이라고 보장하기 어렵다. 이를 ‘일반화(Generalization)’ 문제라고 한다. 또한, 딥러닝 모델이 왜 특정 결정을 내렸는지 그 내부 과정을 이해하기 어려운 ‘블랙박스(Black Box)’ 특성은 안전이 최우선인 자율주행 분야에서 큰 걸림돌이 되기도 한다.37

3.3.3 VBN의 진화가 이끄는 변화

이러한 VBN 기술의 심층적인 발전은 두 가지 중요한 흐름을 만들어내고 있다.

첫째, **하드웨어와 소프트웨어의 공동 설계(Co-design)**가 가속화되고 있다. VBN, 특히 딥러닝 기반 알고리즘의 막대한 계산 요구를 실시간으로, 그리고 저전력으로 처리하기 위한 새로운 하드웨어의 필요성이 대두되었다. 이로 인해 화성 탐사 로버에 탑재된 FPGA(Field-Programmable Gate Array)나 최신 스마트폰의 NPU(Neural Processing Unit)처럼, 특정 AI 연산에 최적화된 맞춤형 프로세서 개발이 활발해지고 있다.44 이제는 소프트웨어가 단순히 주어진 하드웨어 위에서 실행되는 것을 넘어, 소프트웨어의 요구사항이 하드웨어의 설계를 직접적으로 이끄는 시대가 된 것이다. 이는 VBN 알고리즘이 모바일 기기의 물리적 형태와 성능을 결정하는 핵심 동인으로 작용하고 있음을 의미한다.46

둘째, 센서 퓨전의 필연성이 더욱 명확해지고 있다. 4장에서 보았듯이, 모든 센서는 명백한 약점을 가지고 있다.5 자율주행차와 같이 안전이 무엇보다 중요한 응용 분야에서 단 하나의 센서에만 의존하는 것은 불가능에 가깝다. 미래 항법 시스템의 방향은 VBN, LiDAR, GPS, INS 중 ’최고의 승자’를 가리는 것이 아니라, 이들을 지능적으로 융합하여 하나의 센서가 실패하더라도 다른 센서들이 그 역할을 보완해주는 강인한 시스템을 구축하는 것이다.31 스탠포드 대학의 연구 그룹이 “어떻게 정보를 지능적으로 융합할 것인가?“를 핵심 연구 질문으로 삼는 것은 이러한 흐름을 명확히 보여준다.31 결국 VBN의 가장 중요한 역할은, 저렴한 비용으로 풍부한 의미론적 데이터를 제공하여 LiDAR의 정밀성, GPS의 전역성, INS의 반응성을 보완하는, 거대한 센서 퓨전 오케스트라의 핵심 연주자가 되는 것이다.

4. VBN의 현재와 미래 - 기술이 현실이 되는 곳

1부와 2부를 통해 VBN의 기본 원리와 심화 기술을 살펴보았다. 이제 마지막 3부에서는 이 기술이 어떻게 현실 세계의 문제를 해결하고 우리의 삶을 바꾸고 있는지 구체적인 사례를 통해 알아보고, 앞으로 어떤 모습으로 발전해 나갈지 그 미래를 조망해 본다.

4.1 장: 응용 사례 분석 (Case Studies)

VBN은 더 이상 연구실 안의 기술이 아니다. 이미 다양한 산업 분야에서 핵심적인 역할을 수행하며 자율 시스템의 혁신을 이끌고 있다.

4.1.1 자율주행 자동차 (Autonomous Vehicles)

자율주행차에게 VBN은 세상을 인지하는 주된 ’눈’이다. 카메라는 다른 어떤 센서보다 인간 운전자의 시각과 가장 유사한 정보를 제공하기 때문이다.

  • 도로 환경 인식: VBN 시스템은 딥러닝 기술을 활용하여 차선, 도로 경계, 교통 표지판, 신호등을 실시간으로 인식하고 해석한다.48 이는 차량이 차로를 정확히 유지하고 교통 법규를 준수하며 주행하는 데 필수적이다.
  • 객체 탐지 및 추적: 주변의 다른 차량, 보행자, 자전거, 장애물 등을 탐지하고 그 움직임을 예측하여 충돌을 회피하는 데 VBN이 핵심적인 역할을 한다.39
  • 기술적 접근의 다양성: 자율주행 분야에서 VBN의 역할에 대한 접근 방식은 기업마다 다르다. 테슬라(Tesla)와 같은 회사는 인간이 눈만으로 운전하는 것처럼, 고도로 발전된 VBN 시스템만으로 완전 자율주행을 구현할 수 있다는 ‘비전 온리(Vision-Only)’ 접근법을 추구한다.50 반면, 다른 많은 기업들은 VBN을 핵심으로 하되, LiDAR나 레이더와 같은 다른 센서들을 함께 사용하여 악천후나 예기치 못한 상황에서의 안전성과 강인성을 확보하는 센서 퓨전 방식을 채택하고 있다.

4.1.2 드론 및 항공우주 (Drones & Aerospace)

하늘을 나는 기기들에게 VBN은 GPS의 제약을 뛰어넘는 자유를 선사한다.

  • 드론: VBN은 드론이 GPS 신호가 닿지 않는 실내에서 시설을 점검하거나, 고층 빌딩 사이를 오가며 물품을 배송하는 등 새로운 임무를 수행할 수 있게 한다.51 특히 정밀한 착륙 지점을 시각적으로 인식하여 자동으로 착륙하거나, 비행 중 예기치 못한 장애물을 회피하는 데 결정적인 역할을 한다.53
  • 항공우주 (화성 탐사 로버): VBN의 능력이 가장 극적으로 발휘되는 무대는 바로 우주 탐사다. 지구와의 통신에 수십 분이 걸리는 화성에서, 탐사 로버가 실시간 원격 조종으로 움직이는 것은 불가능하다. 스피릿(Spirit), 오퍼튜니티(Opportunity), 퍼시비어런스(Perseverance)와 같은 화성 탐사 로버들은 스테레오 카메라를 이용한 vSLAM과 VO 기술을 통해 스스로 지형을 3D로 파악하고, 위험한 장애물을 피해 안전한 경로를 계획하며 수 킬로미터를 자율적으로 주행한다.7 이는 VBN이 가장 극한의 GPS 음영 환경에서 얼마나 신뢰성 있게 작동할 수 있는지를 보여주는 대표적인 사례다.

4.1.3 증강현실 (Augmented Reality)

증강현실(AR)은 VBN 기술 없이는 존재할 수 없다. AR의 본질은 현실 세계 위에 가상의 디지털 정보를 정확하게 겹쳐 보여주는 것이기 때문이다. 이를 위해서는 시스템이 현실 공간의 기하학적 구조와 사용자의 위치 및 시점을 정확하게 이해해야만 한다.55

  • 공간 인식 및 추적: AR 기기(스마트폰, AR 글래스 등)는 카메라를 통해 실시간으로 주변 환경을 vSLAM 기술로 스캔하여 3차원 지도를 생성하고, 그 안에서 기기의 위치와 자세를 추적한다. 이 기술은 AR 분야에서 흔히 **VPS(Visual Positioning System)**라고도 불린다.55
  • AR 내비게이션: 박물관, 공항, 대형 쇼핑몰과 같은 복잡한 실내 공간에서 AR 내비게이션 앱은 VBN을 활용하여 길을 안내한다. 사용자가 스마트폰 카메라로 주변을 비추면, 앱은 현재 위치를 인식하고 가야 할 방향을 가리키는 가상의 화살표나 경로를 실제 화면 위에 겹쳐서 보여준다.57

4.1.4 로보틱스 (Robotics)

공장이나 물류 창고에서 활약하는 자율 이동 로봇(AMR, Autonomous Mobile Robot)에게 VBN은 역동적인 환경에 적응할 수 있는 유연성을 제공한다.

  • 동적 환경에서의 자율 주행: 과거의 자동 유도 차량(AGV)은 바닥에 그려진 선이나 자기 테이프를 따라 정해진 경로로만 움직일 수 있었다. 하지만 vSLAM이 탑재된 최신 AMR은 스스로 주변 환경을 매핑하고 자신의 위치를 파악하기 때문에, 바닥에 별도의 가이드라인 없이도 사람이나 지게차와 같은 움직이는 장애물을 피해 자유롭게 이동하며 작업을 수행할 수 있다.4 이는 생산 라인의 유연성을 극대화하고 물류 효율을 크게 향상시킨다.

4.2 장: VBN의 미래 전망과 제언

VBN 기술은 지금 이 순간에도 빠르게 진화하고 있다. 앞으로 VBN은 더욱 지능적이고, 몰입감 있으며, 우리 삶 곳곳에 깊숙이 스며들 것이다.

4.2.1 핵심 미래 동향

여러 연구에서 공통적으로 제시하는 VBN의 미래 발전 방향은 다음과 같다.

  • AI 기반 지능형 센서 퓨전: 미래의 센서 퓨전은 단순히 여러 센서 데이터를 합치는 수준을 넘어선다. 인공지능이 실시간으로 주변 환경의 맥락을 파악하여 각 센서의 신뢰도를 동적으로 판단하고 가중치를 조절하는 방식으로 진화할 것이다.58 예를 들어, 맑은 대낮에는 카메라 데이터에 더 높은 가중치를 부여하고, 어두운 터널 안에서는 LiDAR나 열화상 카메라의 데이터를 더 신뢰하는 식이다. 나아가 시각 정보뿐만 아니라 소리, 언어 등 다른 종류의 데이터까지 통합하는

다중 모드(Multi-modal) 시스템은 기계가 세상을 더욱 종합적이고 인간과 유사한 방식으로 이해하게 만들 것이다.47

  • 3D 몰입형 내비게이션: 현재의 2차원 평면 지도를 넘어, 현실 세계를 그대로 복제한 듯한 3차원 지도를 기반으로 한 내비게이션이 보편화될 것이다.46 이는 로봇에게 더 나은 공간 지각 능력을 제공하고, 사용자에게는 AR을 통해 훨씬 더 직관적이고 몰입감 있는 길 안내 경험을 선사할 것이다.61

  • 엣지 컴퓨팅(Edge Computing)의 확산: VBN, 특히 딥러닝 모델의 계산 복잡도가 증가함에 따라, 데이터를 먼 중앙 서버(클라우드)로 보내 처리하는 방식은 한계에 부딪히고 있다. 자율주행차나 드론처럼 즉각적인 반응이 필수적인 분야에서는 기기 자체에서 모든 연산을 수행하는 엣지 컴퓨팅이 표준이 될 것이다.46 이는 더 빠른 반응 속도와 높은 데이터 보안을 보장하며, 저전력 고성능 AI 칩의 발전을 더욱 가속화할 것이다.

4.2.2 진정한 자율성을 향한 길

결론적으로, 비전 기반 항법은 기계가 제한된 환경을 벗어나 복잡하고 예측 불가능한 현실 세계에서 작동하기 위한, 즉 진정한 의미의 자율성을 획득하기 위한 핵심 초석 기술이다. 앞으로의 연구는 알고리즘의 신뢰성을 극한까지 끌어올리고, 계산 비용을 절감하며, 인간 수준으로 동적인 환경을 이해하는 방향으로 계속될 것이다.

이 기술의 발전은 단순히 더 똑똑한 기계를 만드는 것을 넘어, 사회 전반에 걸쳐 중요한 변화를 이끌고 있다. VBN의 핵심 센서인 카메라는 매우 저렴하고 어디에나 존재한다. 이 ’접근성’은 VBN 기술이 고가의 LiDAR를 장착한 자율주행차뿐만 아니라, 우리 손안의 스마트폰을 이용한 AR 서비스, 저렴한 물류 로봇, 소형 농업용 드론에 이르기까지 광범위한 분야에서 자율성의 ’민주화’를 이끌고 있음을 시사한다.55 고가의 장비가 있어야만 가능했던 자율 기술의 혜택을 더 많은 사람이 누릴 수 있게 하는 것이다.

하지만 이러한 발전은 새로운 책임과 과제를 동반한다. 딥러닝 기반 VBN의 성능이 방대한 시각 데이터에 의존하게 되면서, 이 데이터를 어떻게 수집하고 사용할 것인가에 대한 문제가 대두된다.36 자율주행차가 촬영하는 거리의 풍경에는 수많은 사람의 얼굴과 차량 번호판이 포함된다. 이는 데이터 프라이버시, 보안, 그리고 감시에 대한 심각한 사회적, 윤리적 논쟁을 불러일으킨다.46 따라서 VBN의 미래는 순수한 기술적 발전을 넘어, 이러한 사회적 합의를 어떻게 형성해 나갈 것인가라는 질문과 깊이 연결되어 있다.

4.2.3 더 깊은 탐구를 위한 제언

이 안내서를 통해 VBN의 세계에 흥미를 느끼게 된 독자라면, 여기서 멈추지 말고 더 깊은 탐구를 이어가길 권장한다. 다행히도 이 분야의 지식을 체계적으로 배울 수 있는 훌륭한 자료들이 많이 있다.

  • 추천 도서: 가오샹(Gao Xiang) 등이 저술한 **“Introduction to Visual SLAM: From Theory to Practice”**는 vSLAM 분야의 입문자를 위한 바이블과 같은 책으로 널리 인정받고 있다. 이론적 배경과 함께 C++ 코드 예제를 제공하여 실제 구현 감각을 익히는 데 큰 도움이 된다.17
  • 온라인 강좌: MIT의 루카 칼로네(Luca Carlone) 교수나 본 대학의 시릴 슈타흐니스(Cyrill Stachniss) 교수가 제공하는 로보틱스 및 사진측량학(Photogrammetry) 온라인 강좌들은 VBN의 기초가 되는 기하학과 최적화 이론을 탄탄하게 다져줄 것이다.43

비전 기반 항법은 컴퓨터 비전, 로보틱스, 인공지능이 교차하는 가장 역동적이고 흥미로운 분야 중 하나다. 이 기술이 열어갈 미래는 이제 막 시작되었으며, 그 무한한 가능성을 탐험하는 여정에 동참하는 것은 분명 가치 있는 도전이 될 것이다.

5. 참고 자료

  1. Vision Navigation Part 1: Overview of Vision Navigation - AlphaPixel Software Development, accessed July 1, 2025, https://alphapixeldev.com/vision-navigation-part-1-overview-of-vision-navigation/
  2. 위성 항법 - 나무위키, accessed July 1, 2025, https://namu.wiki/w/%EC%9C%84%EC%84%B1%20%ED%95%AD%EB%B2%95
  3. Computer Vision-Based Navigation System, accessed July 1, 2025, https://www.uavnavigation.com/company/blog/computer-vision-based-navigation-system
  4. Understanding Visual Slam Technology | A3 - Association for Advancing Automation, accessed July 1, 2025, https://www.automate.org/vision/blogs/what-is-visual-slam-technology-and-what-is-it-used-for
  5. INS/GPS/LiDAR Integrated Navigation System for Urban and Indoor Environments Using Hybrid Scan Matching Algorithm - MDPI, accessed July 1, 2025, https://www.mdpi.com/1424-8220/15/9/23286
  6. Fundamentals of Vision Based Navigation | NESC Academy Online, accessed July 1, 2025, https://nescacademy.nasa.gov/video/b96ec21b3f9747a1a2c50275c324fe851d
  7. Autonomous Navigation Results from the Mars … - JPL Robotics, accessed July 1, 2025, https://www-robotics.jpl.nasa.gov/media/documents/MER_ISER2004.pdf
  8. From Mars to Maintenance: The Expanding Role of Vision Systems in Space - MVPro Media, accessed July 1, 2025, https://mvpromedia.com/from-mars-to-maintenance-the-expanding-role-of-vision-systems-in-space/
  9. odometry 란? - velog, accessed July 1, 2025, https://velog.io/@jk01019/odometry-%EB%9E%80
  10. Introduction to Visual Odometry - Medium, accessed July 1, 2025, https://medium.com/@3502.stkabirdin/introduction-to-visual-odometry-47bcab3aa213
  11. (PDF) Visual Odometry [Tutorial] - ResearchGate, accessed July 1, 2025, https://www.researchgate.net/publication/220556161_Visual_Odometry_Tutorial
  12. Visual Odometry: A practical guide | by Rushideshmukh | Medium, accessed July 1, 2025, https://medium.com/@rushideshmukh23/visual-odometry-a-practical-guide-71ddff1687cd
  13. Visual Odmetry from scratch - A tutorial for beginners - Avi Singh’s, accessed July 1, 2025, https://avisingh599.github.io/vision/visual-odometry-full/
  14. [SLAM] SLAM개요 : 네이버 블로그, accessed July 1, 2025, https://blog.naver.com/rich0812/222530605519?viewType=pc
  15. 20190224 Visual Odometry 1 (part 1) - YouTube, accessed July 1, 2025, https://www.youtube.com/watch?v=gC-bnvrleno
  16. Visual Odometry Tutorial - John Lambert, accessed July 1, 2025, https://johnwlambert.github.io/vo/
  17. Introduction to Visual SLAM: Chapter 1 - Medium, accessed July 1, 2025, https://medium.com/@dcasadoherraez/introduction-to-visual-slam-chapter-1-introduction-to-slam-a0211654bf0e
  18. Visual SLAM 기법의 종류 - 쑥쑥 크는 조이, accessed July 1, 2025, https://nanunzoey.tistory.com/entry/SLAM-%EA%B8%B0%EB%B2%95%EC%9D%98-%EC%A2%85%EB%A5%98
  19. 스스로 만드는 위치 지도 SLAM 기술의 원리 - LG디스커버리랩, accessed July 1, 2025, https://www.lgdlab.or.kr/contents/6
  20. What is SLAM? A Beginner to Expert Guide - Kodifly, accessed July 1, 2025, https://kodifly.com/what-is-slam-a-beginner-to-expert-guide
  21. Understanding how V-SLAM (Visual SLAM) works | Kudan global, accessed July 1, 2025, https://www.kudan.io/blog/visual-slam-the-basics/
  22. What is visual SLAM? - Educative.io, accessed July 1, 2025, https://www.educative.io/answers/what-is-visual-slam
  23. Advanced Air Mobility를 위한 영상 기반 위치 추정 및 Geo-Referencing 기술 동향, accessed July 1, 2025, https://ettrends.etri.re.kr/ettrends/209/0905209001/001-009.%20%EC%B5%9C%EC%9D%98%ED%99%98_209%ED%98%B8%20%EC%B5%9C%EC%A2%85.pdf
  24. Top three positioning systems for mobile mapping vehicles - Inertial Labs, accessed July 1, 2025, https://inertiallabs.com/top-three-positioning-systems-for-mobile-mapping-vehicles/
  25. Vision-based Localization: A Guide to VBL Techniques for GPS-denied Environments, accessed July 1, 2025, https://encord.com/blog/vision-based-localization-a-guide-to-vbl-technique/
  26. Inertial Navigation Systems (INS) for Defense & Military Applications, accessed July 1, 2025, https://www.defenseadvancement.com/suppliers/inertial-navigation-systems/
  27. 랜드마크 기반 비전항법의 오차특성을 고려한 - Korea Science, accessed July 1, 2025, https://koreascience.kr/article/JAKO201310559989726.pdf
  28. Why use an inertial navigation system (INS) with a LiDAR? - Brendel Associates, accessed July 1, 2025, https://brendelassociates.com/technical-resources/11-why-use-an-inertial-navigation-system-ins-with-a-lidar
  29. How INS Complements LiDAR Technology - Inertial Labs, accessed July 1, 2025, https://inertiallabs.com/how-ins-complements-lidar-technology/
  30. www.mdpi.com, accessed July 1, 2025, https://www.mdpi.com/2504-446X/7/2/89#:~:text=On%20the%20other%20hand%2C%20vision,visual%20information%20from%20its%20surroundings.
  31. Robust Navigation and Sensor Fusion - Stanford NAV Lab, accessed July 1, 2025, https://navlab.stanford.edu/research/robust-sensor-fusion
  32. Sensor-Fusion Based Navigation for Autonomous Mobile Robot - PMC, accessed July 1, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC11861736/
  33. (PDF) Multi Sensor Fusion for Navigation and Mapping in Autonomous Vehicles: Accurate Localization in Urban Environments - ResearchGate, accessed July 1, 2025, https://www.researchgate.net/publication/335542466_Multi_Sensor_Fusion_for_Navigation_and_Mapping_in_Autonomous_Vehicles_Accurate_Localization_in_Urban_Environments
  34. Taeyoung96/SLAM-Resources-for-Beginner - GitHub, accessed July 1, 2025, https://github.com/Taeyoung96/SLAM-Resources-for-Beginner
  35. Robust Multi-Sensor Fusion for Localization in Hazardous Environments Using Thermal, LiDAR, and GNSS Data - MDPI, accessed July 1, 2025, https://www.mdpi.com/1424-8220/25/7/2032
  36. R-VCANet: A New Deep Learning-Based Hyperspectral Image Classification Method, accessed July 1, 2025, https://levir.buaa.edu.cn/static/pdfs/2017_bin_pan_r-vcanet.pdf
  37. [1908.03627] Vision-based Navigation Using Deep Reinforcement Learning - arXiv, accessed July 1, 2025, https://arxiv.org/abs/1908.03627
  38. An Overview on Visual SLAM: From Tradition to Semantic - MDPI, accessed July 1, 2025, https://www.mdpi.com/2072-4292/14/13/3010
  39. Vision-based Navigation of Autonomous Vehicle In Roadway Environments With Unexpected Hazards - College of Engineering, Computing and Applied Sciences - Clemson University, accessed July 1, 2025, https://cecas.clemson.edu/C2M2/wp-content/uploads/2022/11/Final-C2M2-Project-Report-AV-Vision-based-Navigation.pdf
  40. Driven by Vision: Learning Navigation by Visual Localization and Trajectory Prediction - PMC - PubMed Central, accessed July 1, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC7865778/
  41. [2302.11089] Recent Advancements in Deep Learning Applications and Methods for Autonomous Navigation: A Comprehensive Review - arXiv, accessed July 1, 2025, https://arxiv.org/abs/2302.11089
  42. [2404.17745] An Attention-Based Deep Learning Architecture for Real-Time Monocular Visual Odometry: Applications to GPS-free Drone Navigation - arXiv, accessed July 1, 2025, https://arxiv.org/abs/2404.17745
  43. Roadmap to study Visual-SLAM : r/computervision - Reddit, accessed July 1, 2025, https://www.reddit.com/r/computervision/comments/l8pg5r/roadmap_to_study_visualslam/
  44. Visual Navigation | Papers With Code, accessed July 1, 2025, https://paperswithcode.com/task/visual-navigation
  45. MARS 2020 AUTONOMOUS ROVER NAVIGATION* (Preprint) AAS 20-101 - JPL Robotics, accessed July 1, 2025, https://www-robotics.jpl.nasa.gov/media/documents/AAS_2020_mobility_mmc_v10.pdf
  46. From Healthcare to Space: Top 10 Transformative Computer Vision Trends In 2024, accessed July 1, 2025, https://bernardmarr.com/from-healthcare-to-space-top-10-transformative-computer-vision-trends-in-2024/
  47. Emerging Trends in Computer Vision for 2024: A Glimpse into the Future - Proglint, accessed July 1, 2025, https://www.proglint.com/blog/emerging-trends-in-computer-vision
  48. Computer Vision in Self-Driving Cars: Key Applications - TechnoLynx, accessed July 1, 2025, https://www.technolynx.com/post/computer-vision-in-self-driving-cars-key-applications
  49. 9 applications of computer vision in autonomous vehicles - Lumenalta, accessed July 1, 2025, https://lumenalta.com/insights/9-applications-of-computer-vision-in-autonomous-vehicles
  50. Exploring computer vision in navigation applications - Ultralytics, accessed July 1, 2025, https://www.ultralytics.com/blog/exploring-computer-vision-in-navigation-applications
  51. Vision-Based Navigation Drones - GAO Tek, accessed July 1, 2025, https://gaotek.com/category/drones/vision-based-navigation-drones/
  52. Visual-based navigation system, accessed July 1, 2025, https://www.uavnavigation.com/company/blog/visual-based-navigation-system
  53. VNS01 - Visual Navigation System, accessed July 1, 2025, https://www.uavnavigation.com/products/navigation-systems/vns01-visual-navigation-system
  54. Vision-Based Learning for Drones: A Survey - arXiv, accessed July 1, 2025, https://arxiv.org/html/2312.05019v2
  55. AR Indoor Navigation Application Development Guide 2025 - MobiDev, accessed July 1, 2025, https://mobidev.biz/blog/augmented-reality-indoor-navigation-app-development
  56. Visual Positioning System for AR Development : r/augmentedreality - Reddit, accessed July 1, 2025, https://www.reddit.com/r/augmentedreality/comments/1dqznql/visual_positioning_system_for_ar_development/
  57. The Present And The Future of Indoor Navigation With Augmented Reality (AR) - Navigine, accessed July 1, 2025, https://navigine.com/blog/indoor-navigation-using-augmented-reality/
  58. PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications - arXiv, accessed July 1, 2025, https://arxiv.org/html/2505.01881v1
  59. Technological Advancements in Human Navigation for the Visually Impaired: A Systematic Review - PubMed Central, accessed July 1, 2025, https://pmc.ncbi.nlm.nih.gov/articles/PMC11991376/
  60. Top 10 Navigation Technology Trends in 2024 | StartUs Insights, accessed July 1, 2025, https://www.startus-insights.com/innovators-guide/navigation-technology-trends/
  61. Future Trends in Campus Navigation Technologies - Vicinia, accessed July 1, 2025, https://vicinia.io/future-trends-in-campus-navigation-technologies/
  62. Vision Based MAV Navigation in Unknown and Unstructured Environments, accessed July 1, 2025, https://rpg.ifi.uzh.ch/docs/ICRA10_bloesch.pdf
  63. A Starting Point for Learning Visual SLAM - Perception ML, accessed July 1, 2025, https://perception-ml.com/a-starting-point-for-learning-visual-slam/